#Google Gemini
Google的Gemini開掛了,重磅利多多到數不過來
不到一周的時間,我數了數GoogleGemini的重磅利多,至少5個。不是AI應用的dau、tokens的線性利多,而是GoogleAI生態版圖的巨大擴張。Apple的AI選定了Gemini1月12日,Apple和Google發了個聯合聲明,Apple以後的"AI大腦"要用Gemini了。果粉之前的預期可是ChatGPT,結果呢?一年多過去,Apple官宣把核心AI基座換成了Google的Gemini。這個轉變的意義太大了。Apple全球有23.5億活躍裝置——iPhone、iPad、Mac等全家桶把OpenAI被踢出了核心圈。為什麼?Gemini是"原生多模態"架構,天生就能同時理解文字、圖片、聲音、視訊。Gemini 3 Pro/Flash更是靈活快捷適配各種差異化場景。Apple正在開發的那個"螢幕感知"功能——就是讓Siri能"看懂"你手機螢幕上顯示的內容然後幫你操作,用Gemini就順手得多。OpenAI的"泡沫論"和模型能力越來越難打動蘋果。Walmart和Shopify:Gemini的AI電商加速對Google來說,可能Walmart和Shopify的電商合作更有想像空間。1月11日,在紐約的零售業大會上,Walmart和Shopify幾乎同時宣佈跟Google深度合作。表面上看是"在Gemini裡能買東西了",但實際上Google在幹一件意義更大的事:制定代理商務(Agentic Commerce)的行業標準。什麼是代理商務?簡單說就是:以後你不用再打開淘寶、京東、亞馬遜這些App了,直接跟AI說"幫我買個XX",AI就替你下單、付款、安排配送。你只需要等著收貨。Google搞了個叫UCP的協議(Universal Commerce Protocol),讓所有商家都能用統一的格式接入AI。Walmart、Target、Best Buy、Home Depot這些零售巨頭都加入了,連Visa、Mastercard、American Express這些支付公司也進來了。這意味著什麼?意味著以後Gemini可能成為電商的大流量入口。你跟Gemini說"春季露營需要什麼裝備",它不光告訴你需要帳篷、睡袋、戶外爐具,還能直接推薦Walmart的具體商品,你點一下就下單了,全程不用離開聊天介面。Walmart甚至承諾30分鐘內送達。這不就是亞馬遜最怕的事情嗎?以前大家買東西第一反應是打開亞馬遜搜尋,以後可能變成直接問Gemini,亞馬遜就被架空了。Shopify那邊更有意思。它有560萬商家,大部分是中小賣家。這些人以前想觸達消費者,要麼花錢打廣告,要麼入駐亞馬遜被抽成。現在通過Gemini,他們的商品能直接出現在AI對話裡。使用者可能在聊滑雪的時候,就順手買了某個小眾品牌的滑雪鏡,根本不知道這品牌的獨立站長什麼樣。Shopify自己披露的資料也很誇張:過去一年,AI驅動的購買增長了11倍,這AI電商的爆發力太猛了。打通自家Gmail的30億使用者1月8日,Gmail正式全面上線Gemini功能,郵件摘要、一鍵生成回覆、AI收件箱檢視。看似不是什麼高科技,但架不住使用者基數太可觀了。而且,美國Fortune媒體還披露了一個重要的資料:70%的企業使用者採納了Gemini的寫作建議,轉化率遠超行業預期。商業化路徑也很清晰:基礎AI功能免費提供,但高級功能如信箱提問、專業校對需訂閱Pro版本$19.99/月,或者AI Ultra版本$249.99/月。30億使用者裡那怕只有1%付費,那也是3000萬訂閱使用者,光Gmail一項每年就能帶來幾十億美元的增量收入。Google披露他們總訂閱使用者已經超過1.5億了(含Google One和YouTube Premium),過去15個月增長了50%,而且還在加速。端側巨頭三星:加大合作至8億裝置除了前面那四個合作,還有一個差點被我忽略的,是另外一家全球端側巨頭三星的合作。今年CES上,韓國三星聯合CEO TM Roh宣佈要把Galaxy AI裝置數量從去年的4億台,翻倍到8億台,包括手機、平板、手錶、智能家電。Galaxy AI的品牌認知度在一年內從30%飆升到80%。通過三星的分發管道,Google Gemini獲得了一個無需app下載的大規模硬體分發優勢。你想想這個畫面:全球最大的Android手機廠商,加上全球最大的iOS裝置(Apple),加上全球最大的智能音箱和電視生態(Google自己的),全都跑Gemini。這樣的端側分發優勢,OpenAI和微軟短期內根本沒法趕上。最後聊聊估值Alphabet在2025年全年股價漲了65%,是"Big Five"裡表現最好的。市值首次突破了4兆美元,坐穩了全球第二大的公司。華爾街給的評級幾乎全部唱多,目標價普遍在315-390美元之間。Cantor Fitzgerald:將Google評級上調至“超配”,目標價370美元,稱其為“所有AI交易的王者”(King of all AI trades)。理由是Google是唯一一家同時擁有晶片、模型、雲基礎設施和數十億使用者級應用(App)的全端巨頭。Wedbush:認為蘋果的交易是“巨大的勝利”(Monster Win),消除了籠罩在Google頭上的長期陰雲。Morgan Stanley:隨著AI應用變得越來越複雜,企業將傾向於使用Google這樣的一體化平台,從而推高Google Cloud的估值。投行們的邏輯很直接:Gemini月活6.5億,增速30%,比ChatGPT的6%快多了;雲業務同比增長34%,合同積壓1550億美元;再加上這一波戰略合作的協同效應還沒完全釋放。AI一天,人間一年。一年前,大家還在討論ChatGPT會不會顛覆Google搜尋。現在劇情反轉了。Google不但守住了搜尋,還通過Gemini殺進了Apple、三星的生態、Walmart的貨架、Shopify的中小企業店舖、Gmail的信箱。而且這還只是Gemini的生態起點。2026年會是"AI落地驗證年"。到底誰的技術更強、誰的生態更穩、誰的商業化更順,很快就能見分曉了。 (FinHub)
蘋果選中Gemini,Google登上“4兆”
蘋果與Google達成為期數年的合作關係,將依託Gemini模型和Google的雲技術支援蘋果基礎模型,蘋果的聲明稱,經仔細評估,認為“Google的技術為蘋果基礎模型提供了最強大的基礎” 。早盤曾跌1%的Google母公司盤中轉漲並一度漲1.7%,盤初曾跌1%的蘋果也轉漲。蘋果公司確認,選定Google的Gemini 模型支援今年將面世的人工智慧(AI)新功能,包括新版的Siri功能。這一重磅消息推動Google母公司Alphabet周一股價止跌轉漲,市值史上首次突破4兆美元,成為繼輝達、微軟、蘋果之後第四家躋身這一超高市值的上市公司。美東時間12日周一,媒體援引蘋果的聲明稱,蘋果與Google達成為期數年的合作夥伴關係,蘋果將依託Google的Gemini模型和雲技術為未來的蘋果基礎模型(Apple Foundation Models)提供支援。消息公佈後,周一早盤曾跌1%的Alphabet股價迅速抹平跌幅,日內漲幅一度達到1.7%、漲至334.04美元,最終收漲超1%,連續三個交易日創收盤歷史新高,成功跨過4兆美元市值門檻。上周,Alphabet的市值剛超越蘋果,成為目前僅次於輝達的全球第二高市值公司。本周一盤初同樣一度跌1%的蘋果股價也小幅轉漲,收漲逾0.3%,在七連跌後兩連陽。這一合作標誌著蘋果在AI領域的重大戰略調整。雖然蘋果和Google在智慧型手機、作業系統和服務領域互為競爭對手,但兩家公司早已在搜尋業務上建立了合作關係。Google每年向蘋果支付數十億美元,以使其搜尋引擎成為蘋果產品的默認選項。Alphabet乘AI浪潮躋身4兆俱樂部Alphabet股價在2025年累計漲幅超過65%,成為美股科技七巨頭中表現最佳的股票,創下自2009年金融危機後股價翻倍以來的最大年度漲幅。這一強勁表現反映了投資者將該公司視為人工智慧領域的主要贏家。目前,只有輝達、蘋果和微軟的市值曾突破4兆美元大關。輝達和微軟於去年7月首次觸及這一里程碑,蘋果則在去年10月首次跨越這一門檻。不過,蘋果和微軟此後均已大幅跌破4兆美元關口。Alphabet的崛起得益於該公司在AI領域的全面佈局。去年11月,該公司推出了第七代張量處理單元Ironwood,這款定製AI晶片成為輝達產品的潛在替代選擇。去年12月,Google發佈的Gemini 3大語言模型獲得廣泛好評,在與OpenAI的GPT-5競爭中取得進展。上周,Google的市值自2019年以來首次超越蘋果。蘋果與Google合作詳情據本周一報導,與Google達成的多年合作協議將讓蘋果得以利用Gemini模型和Google雲技術支援未來版本的Apple Foundation Models。蘋果在聲明中寫道,經過仔細評估,蘋果認為“Google的技術為蘋果基礎模型提供了最強大的基礎,我們非常期待它將為使用者帶來的創新體驗。”不過,上述報導稱,新功能將於“今年晚些時候”推出,但蘋果的聲明並未提供具體時間表。蘋果和Google均未確認該協議的技術或財務條款。這一合作讓蘋果在AI領域的長期合作探索消息塵埃落定。去年8月曾有報導稱,蘋果正與Google就使用定製Gemini模型驅動新版Siri進行早期磋商。為了決定是繼續使用內部模型還是轉向合作夥伴,蘋果據稱同時開發了兩個版本的新Siri:代號為Linwood的版本由蘋果自有模型驅動,代號為Glenwood的版本則基於外部技術運行。據當時報導,為修復Siri的缺陷並讓已延遲推出的Siri AI功能順利面世,蘋果曾將Anthropic視為最佳合作對象,但Anthropic提出的財務條款要求促使蘋果擴大合作選擇範圍,除了Google和Anthropic,蘋果也在考慮與OpenAI合作。Google搶先在Gemini中引入廣告就在與蘋果達成合作的同時,Google上周日宣佈正在其AI購物工具中引入新的個性化廣告功能,標誌著科技巨頭在AI變現競賽中邁出關鍵一步。廣告主將能夠向通過GoogleAI模式準備購買商品的消費者提供專屬優惠,該模式由Gemini模型驅動。Google廣告與商務副總裁Vidhya Srinivasan表示,這是一個超越傳統搜尋廣告模式的新概念,使零售商能夠在最關鍵時刻向AI模式購物者提供價值以促成交易。Google的AI將根據使用者的購物行為和購買可能性來決定何時展示優惠。此舉正值AI聊天機器人對Google傳統"贊助"廣告位構成威脅之際,該廣告位每年為Google帶來數百億美元收入。包括OpenAI、微軟和Perplexity在內的AI公司在過去一年中競相在其聊天機器人中推出電商功能,以尋找從其成本高昂的AI產品中產生收入的新方式。 (invest wallstreet)
Google Gemini和蘋果的頂級華人科學家離職創業,劍指AGI
【新智元導讀】Google Gemini 資料聯合負責人 Andrew Dai 聯手蘋果首席研究科學家 Yinfei Yang,隱身創辦 AI 新秀 Elorian。首輪將融資 5000 萬美元,劍指「視覺推理」這個下一代大模型的核心問題。矽谷的 AI 創業熱潮中,最昂貴的籌碼永遠押注在最資深的「大腦」上。曾在Google DeepMind 效力長達 14 年的資深研究員 Andrew Dai,正在籌建一家名為 Elorian 的 AI 初創公司。這家尚不為人所知的公司,種子輪融資目標即高達 5000 萬美元。與 Andrew Dai 聯手的,是剛於去年 12 月離職的蘋果研究科學家 Yinfei Yang。這兩位分別來自Google和蘋果的技術老兵,正在試圖解決大模型領域的下一個核心問題:視覺推理(Visual Reasoning)。領投這輪融資的,極有可能是由前 CRV 普通合夥人 Max Gazor 創立的 Striker Venture Partners。如果交易達成,這將是矽谷近期最受矚目的早期融資之一,也再次印證了資本市場對於「Google畢業生」的瘋狂追捧。14 年,從 BERT 早期到 Gemini 幕後在 AI 研究圈,Andrew Dai 這個名字代表著一種「長期主義」。不同於那些在 Transformer 浪潮爆發後才匆匆入局的創業者,Andrew Dai 在Google的工號可以追溯到 2012 年。這意味著他完整經歷了深度學習從邊緣學科走向世界中心的整個周期。在他的 LinkedIn 履歷中,最引人注目的是他作為 Gemini 模型預訓練(Pre-training)資料工作的聯合負責人。在當前的大模型戰爭中,資料質量和預訓練策略被認為是決定模型智商上限的關鍵因素。能夠在這個核心環節擔任負責人,足以證明他在Google內部的權重。Andrew Dai 的學術貢獻不僅限於此。他曾與Google首席科學家 Jeff Dean 以及 Quoc V. Le(Google Brain 的傳奇人物)共同撰寫過多篇論文。早在 2015 年,他發表的一篇關於半監督序列學習(Semi-supervised Sequence Learning)的論文,就被認為對後來 OpenAI 的 GPT 系列模型產生了深遠的啟發。https://proceedings.neurips.cc/paper/2015/file/7137debd45ae4d0ab9aa953017286b20-Paper.pdf一位熟悉 Andrew Dai 的人士評價道:「他是語言模型的先驅之一,過去二十年一直專注於預訓練相關的研究。他最擅長的,就是如何從海量、嘈雜的資料來源中提煉出高品質的“知識”。」如果說 Andrew Dai 代表了Google在巨量資料處理上的暴力美學,那麼聯合創始人 Yinfei Yang 則帶來了蘋果係的精緻與多模態視角。Yinfei Yang 此前在蘋果機器學習團隊擔任首席研究科學家(Principal Research Scientist),主要參與蘋果自研 AI 模型的開發。在加入蘋果之前,他也曾在 Google Research 工作過四年,專注於多模態表示學習。他在圖像-文字共嵌入(Image-text Co-embedding)領域的專長,恰好填補了單純語言模型的感知短板。視覺推理不只是「看見」,更要「理解」Elorian 究竟想做什麼?根據 Andrew Dai 的說法,Elorian 並不是要再造一個 ChatGPT,而是要建構一個能夠「同時理解和處理文字、圖像、視訊和音訊」的原生多模態模型。目前的 AI 模型大多是基於文字訓練,再通過「補丁」的方式接入視覺能力。而 Elorian 的願景是建構一個天生的「通感者」。這種模型不再是將圖片轉化為文字標籤,而是像人類一樣,通過視覺直接感知物理世界的邏輯。「視覺推理」被認為是通向 AGI 的必經之路。Andrew Dai 提到,機器人將是 Elorian 技術的一個潛在應用場景,但他強調公司的願景遠不止於此。在矽谷的投資人眼中,這通常意味著 Elorian 瞄準的是 AI 智能體的廣闊市場——一個能夠像人類一樣看著電腦螢幕、理解圖形使用者介面(GUI)、處理退貨流程、稽核法律檔案、操作其他軟體的超級助手。它不需要你通過 API 喂給它資料,而是直接像你一樣「看」著 Excel 表格、「聽」著電話錄音,同時「讀」懂螢幕上的郵件,並即時做出決策。這就是 Elorian 試圖建構的未來。資本的邏輯為「血統」買單5000 萬美元的種子輪融資,在幾年前聽起來像是天方夜譚,但在今天的 AI 泡沫中,這似乎成了頂級團隊的「入場費」。正在與 Elorian 洽談領投的 Striker Venture Partners,本身也是一家極具話題性的新銳基金。其創始人 Max Gazor 曾是老牌風投 CRV 的合夥人,以眼光毒辣著稱。他在去年 10 月剛剛自立門戶,Elorian 很可能是該基金成立後的首批標誌性賭注之一。對於 Max Gazor 這樣的投資人來說,他們賭的不僅僅是技術路徑,更是「Google DeepMind + 蘋果」這種稀缺的基因組合。Google提供了大規模訓練基礎設施的經驗,而蘋果則有著將 AI 落地到具體產品的務實文化。Elorian 的出現,也折射出大模型戰場的轉移。第一階段的戰爭是關於「文字生成」,OpenAI 憑藉 ChatGPT 拔得頭籌;第二階段的戰爭則是關於「多模態理解」和「物理世界互動」。在這個新戰場上,無論是 Gemini 還是 GPT,都在瘋狂補課視覺能力。Elorian 作為一個初創公司,想要在巨頭的夾縫中生存,唯一的籌碼就是技術上的代差,或者在垂直場景(如複雜的視覺 Agent)上做到極致。在矽谷,每一個從巨頭出走的頂級研究員,都懷揣著一個「反叛」的夢想:用更小的團隊、更聚焦的資源,去顛覆老東家龐大而遲緩的官僚體系。Andrew Dai 離開了效力 14 年的Google,Yinfei Yang 離開了發佈 Apple 智能的蘋果。他們選擇了一條最艱難的路——試圖教會機器不僅「看見」世界,還要「看懂」世界。這讓人想起電腦視覺領域的一句老話:「攝影機只是眼睛,演算法才是靈魂。」而在 AI 的洪流中,真正稀缺的永遠不是算力,而是那些能夠透過資料的迷霧,看清未來方向的眼睛。 (新智元)
AI進入「拼爹」的時代
有技術的,幹不過有背景的?如果說AI故事的第一章叫作「技術的革命」,那麼第二章的主題,看起來越來越像「權力的遊戲」。王晶曾說,過去的香港,每個拍電影的都是有“背景”的。因此演員和導演往往身不由己,電影生意的競爭也往往是背景的競爭。AI生意越來越有這個意思。大家都帶著背景和資源,這裡是Google、微軟、Meta、字節、騰訊、阿里交鋒的修羅場。每一天,抖音用自己浩如煙海的流量鋪天蓋地推舉豆包。Google用全公司的資源,在一系列APP裡狂推自己的Gemini。這種巨頭之力,那怕優秀如Manus、OpenAI也難以對抗。2025年11月起,原本落後的Google迅速在性能和使用者上追趕上了ChatGPT,尤其是在多模態領域,已經反超OpenAI在各種評測中位居第一。奧特曼直言,Google的崛起給OpenAI帶來很大的壓力。曾經火遍全球的通用智能體Manus,也放棄了單打獨鬥,網際網路巨頭Meta選擇將收購Manus。Kimi、DeepSeek這些紅極一時的“當紅炸子雞”早已被豆包、元寶鋪天蓋地的流量壓了下去。在這個拼爹的世界裡,似乎只有超級巨頭才有上桌的資格。以小博大的故事在商業裡十分常見。那怕是騰訊、阿里、Google、蘋果,也經常在某個領域輸給創業公司。但在AI裡,這種故事好像顯得困難了許多。看能力,更看資源娛樂圈裡有一種說法,藝人只要給足飽和式的曝光,都能紅。這也是眼下AI領域的現狀。ChatGPT是ChatBot的發明者,相當於蘋果發明了現代智慧型手機,無論是技術,還是品牌,都是真正的遙遙領先。但當超級巨頭Google發力,ChatGPT很快感受到了壓力。Gemini在多項機構評測中反超GPT,奧特曼在內部信中發出警告:公司的技術領先優勢正在縮小,並預計外界氛圍將在一段時間內“相當艱難”。國內市場,豆包早已取代Kimi成為月活第一的LLM產品。以搭載DeepSeek為賣點的元寶使用者資料也早已反超DeepSeek,成為了DeepSeek崛起的流量受益者。它們為什麼如此強勢,逆襲領先者?答案當然是因為有Google、字節跳動這些大廠在背後提供資源。其實明星AI創業公司背後都有大企業和大資本的投資,帳上也有很多錢,也有很多資源。但背靠巨頭帶來的生態優勢,創業公司們真的沒法復刻。比如Google直接把Gemini植入Android,作為默認的手機助手。Google還有排名第一的瀏覽器Chrome,Gmail,微軟的Copilot也直接融入Office套件。這種與常用APP繫結的方式,使用者不用也得用——而且為什麼不用呢?深度整合入常用APP的AI,體驗是非常絲滑的。金山軟體和微軟一樣,直接把AI融進WPS裡。騰訊也直接把元寶塞進微信裡,使用者無需下載任何APP就能在微信聊天框裡體驗到LLM。那怕是AI落腳點相對少的阿里和螞蟻,也有支付寶、夸克這樣的優質入口。這樣的做法OpenAI、Manus、Kimi們要如何模仿?難道為了與大廠競爭,還要自己做一個手機作業系統或者微信?有些生意,是自力更生,創業公司挑戰巨頭雖然困難,但也有機會。比如米哈游靠著幾部爆款遊戲,迅速在二次元遊戲領域裡成為老大,網易和騰訊資源再多,也沒能阻止米哈游的崛起。但有些生意,對外界的依附太重。AI應用恰恰是這種生意。第一,當然是因為它資產太重,網際網路產品最大的成本往往是買流量,但AI背後可能是數千億美元的固定資產,居民樓創業玩不轉。第二,更重要的是,它的使用場景,與生態的繫結太深,太需要與其他產品的聯動。Manus就是個很好的例子:它的功能當然強大,但在個人使用者端完全沒法獨立幹活,它需要“呼叫”其他網頁,依賴瀏覽器和瀏覽器中的資料。比如訂一張機票,需要帳號授權、支付授權——這些東西都掌握在Google、蘋果、微信這種巨頭手裡。Manus干的是系統級的活,卻完全沒有系統級的權限。相當於普通孩子學了一門“千萬資產理財課”,但他家卻沒有千萬資產。當Google這種瀏覽器和手機作業系統的擁有者親自下場,留給獨立智能體的空間就會越來越狹小。AI搜尋也感受到了這種壓力。畢竟在這個時代,搜尋早不是什麼獨立的APP了,iPhone裡的搜尋框,是由蘋果公司控制的。Perplexity再好用,它也不是蘋果的默認搜尋引擎——Google一年付200億美元獲得了這個身份。在國內,搜尋框則由百度、微信、手機廠商把持,他們很難把搜尋框交給AI創業公司。即便他們利用技術優勢,暫時在大廠的競爭壓力中獲得一定份額,他們還要面臨第二個難題:變現。AI的變現,也得拼爹富貴人家,總是更容易收回教育孩子的成本。他們送孩子去讀個水碩,可以憑藉家庭關係安排進國際銀行,或者進入家族企業擔當要職。但窮人家送孩子去國外讀一年碩士,畢業卻可能會因為學歷含金量不高找不到工作。視角切到AI的變現身上,也沒什麼不同,同樣的一個技術,小公司持有難以變現,大公司就能以不同的方式收到錢。比如在OpenAI還在陷入虧損難題的時候,微軟就通過把GPT服務打包進自家雲服務實現了業績的大幅度增長。OpenAI Service已經成了微軟Azure的王牌產品之一,畢竟客戶們本來就購買了微軟的雲服務,再買點AI服務,屬於捆綁銷售。更不用說Copilot和Office(Microsoft 365)的聯動,微軟把AI工具加入到辦公套件裡,上調訂閱費——不接受?那就別用Office。這也是微軟過去十年重要的增長來源。每當新技術、新變革、新功能出現時,他們就可以對訂閱服務漲價。當然這種漲價是雙贏的,客戶也收穫了便利和價值。在C端,從Gemini和OpenAI的會員中,也可以看到捆綁銷售能力的差距:同樣是賣20美元,Google就可以打包把GoogleOne(Android版本的iCloud)一併打包售賣,AI之外,使用者還能獲得Gmail、相簿裡的儲存空間。這是非常具備吸引力的捆綁銷售方案,畢竟那怕不用AI,使用者也需要郵件和存照片。不難想像,如果Manus屬於Google這樣的巨頭,也許它也會把Manus的訂閱服務加進這個20美元套餐裡,Manus的變現就會更加順滑。而OpenAI的訂閱幾乎只有ChatGPT,那怕Sora、Codex等新產品,也是靠OpenAI自己做的。豆包的變現花樣更加豐富。豆包的回答會把流量引入短影片——之後的商業模式就可以和抖音一樣了,在視訊中間插入廣告就好。豆包還上線了直接的Chat廣告,對話方塊的回答可以直達抖音生態內部的本地生活等服務。比如在豆包裡問附近的好餐館,豆包會直接給出團購連結。圖註:點選連結,就能直達餐館的抖音團購介面這種商業模式Kimi們很難學習,畢竟創業公司可沒有抖音那麼多短影片儲備,也沒有發達的本地生活服務或者電商的供應鏈。它只能向外去賣流量,但眼下的AI行業格局來看,大多數交易平台並不願意把入口交給其他AI工具,即便願意,變現的轉化率也不如生態內那樣高。如果沒有這些變現花樣,那麼AI的商業模式和老乾媽辣醬差不多——一手交錢,一手交貨。也就是在B端賣Token,C端賣訂閱。但這個模式太捲了:客戶只在乎多少錢買到多少Token,難以像微軟的雲服務一樣溢價。個人使用者的訂閱費價格被使用者習慣和行業共識限制:要麼20美元,要麼10-30人民幣。這是多個行業與使用者長期博弈出來的價格,是使用者訂閱習慣的平衡點,大多數行業的訂閱會員,最後都會回歸到這個數字附近。圖註:MiniMax國內產品“星野”的訂閱費用。事實上,國內大多數會員的網路訂閱會員的價格都在這個數字附近,誰想賣更貴都很困難。最近遞交招股書的智普AI和MiniMax,虧損資料都十分嚴重——創業公司,虧損當然很正常,但它們的虧損呈現逐年擴大趨勢,暫時看不到盈利預期在那裡。事實上,這二者的虧損被廣泛討論並不是因為它們的虧損尤為突出,只是因為它們遞交了招股書,在那些沒有遞交招股書的AI企業中,還藏著更為廣泛、普遍的虧損。那怕是已經有7億使用者的OpenAI也不例外。而這個問題,創業公司自己解決起來異常困難,最終很可能需要仰仗大廠的力量。小蝌蚪找爸爸在這個“拼爹”的世界裡,單打獨鬥似乎很難出頭。當出價合理,賣身給巨頭,也是不錯的選擇。Meta接連宣佈收購Scale和Manus,蘋果也被爆出考慮收購Perlexity。一旦被收購,情況就完全不同了。以Manus為例,它過去想呼叫一些功能,要看其他公司給不給權限,還要面臨巨頭自研智能體的競爭風險。但一旦屬於Meta,Manus就可以直接在WhatsAPP、INS、Messenger、Facebook裡獲得原生等級的權限,隨意呼叫各種聊天、購物的功能。更不用說Meta還有AI硬體的佈局,如果與AR眼鏡結合,Manus就能直接獲取SIRI等級的權限。這類AI應用公司,被大廠收購的好處實在是顯而易見。當然,如果自己能成為大廠,誰願意依附大廠呢?OpenAI就不願意。OpenAI原本是有巨頭靠山的,微軟是它的最大的單一機構股東。但可惜,由於特殊的架構,微軟並沒有獲得OpenAI的控制權。微軟管不了OpenAI,自然就不拿它當“親兒子”,不但自己有自己的AI產品,還訓練自己的模型。OpenAI也不想給誰做子公司,作為LLM的最大開創者,它只想自己成為超級大廠。明明微軟有現成的Edge瀏覽器,但OpenAI還是自己想做瀏覽器Atlas,明明微軟是最大的雲服務商,自己找合作夥伴建立算力能力,還與Google合作購買GCP服務。顯然,OpenAI希望成為美股七姐妹那樣真正的超級巨頭。這條路在網際網路時代是被驗證過的,每當行業出現大的變革,總會出現創業公司的崛起,用靈活性打得巨頭節節敗退,甚至最終自己成為巨頭。比如字節跳動在BAT三家統治的網際網路裡,硬是從居民樓裡殺出一條血路,成為網際網路的新一極。還有拼多多、米哈游這種在與騰訊和阿里的競爭中勝利,成為細分領域頭部的公司。畢竟行業的紅利時期總是充滿變革,方向、創意、技術、靈活性才是最重要的。但這條路在AI領域顯得難了太多,三年過去,創業公司的靈活性優勢和先發優勢不斷被大廠的體量碾壓,超級巨頭的優勢愈發明顯。巨頭對各種系統級的入口掌握權限,起到的作用太大了。如果說AI故事的第一章叫作「技術的革命」,那麼第二章的主題,看起來越來越像「權力的遊戲」。 (鈦媒體)
Fortune雜誌─Gemini正將Google創始人25年前的設想變為現實
25年前,Google(Google)聯合創始人賴利·佩奇對搜尋引擎的構想,與如今其人工智慧產品Gemini所能實現的功能驚人地相似。佩奇與聯合創始人謝爾蓋·布林共同創立了Google。自1998年公司成立至2001年,他擔任了首任首席執行長,隨後由埃裡克·施密特(Eric Schmidt)接任,施密特在該職位上任職了十年。Google創立時,搜尋引擎的概念仍相對新穎。Google憑藉其PageRank演算法將搜尋技術提升到了新高度。該演算法通過分析網頁間的超連結來對最佳結果進行排序,而非僅僅依賴關鍵詞匹配。佩奇當時表示:“當時的搜尋引擎並不真正理解那些頁面更重要。如果你輸入‘史丹佛’,得到的只是一些隨機提及史丹佛的頁面。這顯然行不通。”Google聯合創始人賴利·佩奇(左)與謝爾蓋·布林。圖片來源:Kim Kulish—Corbis/Getty Images短短幾年內,Google的創新使其從一個被AltaVista和雅虎(Yahoo)等市場巨頭碾壓的無名小卒,成長為真正的競爭者。到2000年,這家行業新秀已佔據25%的搜尋市場份額——這一進步顯著,但仍遠未達到如今90%的統治地位。佩奇稱,公司2000年的搜尋廣告收入為8000萬美元;而到了2024年,這一數字已接近2000億美元。然而,佩奇對Google及搜尋的未來懷有更宏偉的期望。他在2000年10月接受非營利教育機構美國成就學院(American Academy of Achievement)的一次近期被重新關注的採訪中表示:“人工智慧將是Google的終極形態。如果我們擁有終極搜尋引擎,它將能理解網路上的一切,精準知曉你想要什麼,並給出正確答案。而這顯然就是人工智慧——能夠回答任何問題,因為幾乎所有資訊都已存在於網路之中。”儘管他當時補充道:“我們現在離那還差得遠。”但Google近期升級的Gemini,或許是實現佩奇25年前願景最接近的一次。OpenAI在2022年底率先推出ChatGPT,搶佔了先機。隨後數月,Google匆忙推出了自己的大語言模型。2023年2月,Google發佈了Bard,之後將其更名為Gemini。Google在將AI融入搜尋方面也取得了重大進展。今年5月,Google重塑了其標誌性搜尋引擎,新增了一個名為“AI模式”的標籤頁,整合了Gemini功能。該模式不再僅僅提供連結列表,而是以自然語言直接回答搜尋問題。與此同時,ChatGPT正在取代至少一部分原本專屬於Google的查詢需求。憑藉Gemini的最新更新,Google或許已領先於競爭對手。據《華爾街日報》(Wall Street Journal)報導,行業基準測試顯示,Google這款旗艦大語言模型的新版本在性能上已超過ChatGPT及Anthropic的Claude等其他競爭者。上周,Google將其最新大語言模型Gemini 3 Flash版本,整合到了面向全球使用者的AI模式搜尋工具中。公司稱,其先進的推理能力將為使用者更複雜的問題提供更優質的答案。憑藉多模態推理能力,Google最先進的AI能夠在單次提示中,基於文字、圖像、音訊、視訊和程式碼進行解讀與推理。雖然它尚不能預測使用者需求,但其上下文窗口高達100萬個詞元(token),這意味著它能呼叫大量先前的資訊來生成對使用者查詢的回覆——尤其擅長處理冗長且微妙的提示。Gemini已不僅僅是一個被動的搜尋引擎,其代理執行使用者任務的能力也遠超以往版本。它可以在Google生態系統內協同工作,管理使用者的收件箱並行送郵件。在程式設計方面,這款大語言模型能夠即時“觀察”並在幾秒內給出後續步驟建議。Google宣稱,Gemini 3能在幾分鐘內幫助使用者將一個想法轉化為可運行的原型。儘管25年前佩奇將“終極搜尋引擎”描繪為一個遙遠的目標,但公司正逐步接近實現他的願景。(財富中文網)
Google2025「復仇爽文」大結局!從至暗時刻到王者歸來
【新智元導讀】年初被唱衰,年底卻直接封神:2025年的Google,把AI圈寫成了一本爽點密集的復仇小說!Gemini 3、Nano Banana、諾獎、晶片、智能體齊上陣:矽谷AI鐵王座還是Google的!回顧2025年,對於Google來說,可謂是一部跌宕起伏的「復仇爽文」。如果說年初外界還在唱衰這家巨頭「大象難轉身」,那麼到了年底,Google用實力上演了一出從被打落神壇,到揚眉吐氣、重回巔峰的好戲。尤其是年底這波Gemini 3和Nano Banana的組合拳,簡直是降維打擊!不僅穩穩佔據了LMArena的榜首,更是在推理和多模態能力上打得對手OpenAI一個措手不及。Google在向世界宣告:矽谷的AI鐵王座,依然姓Google。就在剛剛,GoogleAI掌門人們:首席科學家Jeff Dean、DeepMind CEO Demis Hassabis以及負責技術與社會的SVP James Manyika三位重量級人物聯名發佈了Google2025年度總結。而且也給AI這一年定了一個基調:這一年,是屬於AI智能體、深度推理與科學探索的大成之年。Google這一年把「科研」變成「現實」,在8大領域實現了全面突圍。以下是Google這一年「秀肌肉」的高光時刻:模型層面的「碾壓」:Gemini 3重新定義天花板Google今年的策略非常狠:「下一代的Flash模型要比上一代的Pro模型更強」。從3月發佈的Gemini 2.5到11月震驚業界的Gemini 3,Google徹底解決了推理能力的瓶頸。Gemini 3不僅在「人類終極考試」這種變態難度的基準測試中拿下了突破性高分,更通過Gemini 3 Flash實現了性能與成本的完美平衡。現在的Google模型,既能深思熟慮(DeepThink),又能快如閃電。開發者的「新紀元」:Google Antigravity如果說以前的Copilot只是幫你補全程式碼,那麼Google今年推出的Google Antigravity則是徹底顛覆了軟體開發。這不是工具,而是真正的「Agent(智能體)」。配合非同步程式設計Agent Jules,現在的開發者擁有的不再是一個助手,而是一支隨叫隨到的專家團隊。創意工具的「爆發」:Nano Banana 與Veo在生成式媒體領域,Google今年簡直是「玩嗨了」。Nano Banana Pro和Veo 3.1的出現,讓圖像編輯和視訊生成進入了專業級時代。無論是通過Nano Banana進行原生的圖像修改,還是用MusicAI Sandbox輔助音樂創作,Google正在把頂級創意能力下放給每一個人。科學界的「諾獎收割機」這或許才是Google真正的護城河!2025年,AlphaFold團隊不僅迎來了5周年,更見證了Hassabis等人憑藉它斬獲諾貝爾獎的榮耀。不僅如此,Google員工Michel Devoret亦在今年榮獲諾貝爾物理學獎。從AlphaFold到能解決數學奧賽金牌題目的DeepThink,再到AI科學家,Google證明了AI不僅僅是聊天機器人,更是解開宇宙奧秘的鑰匙。硬核基建:Ironwood與AlphaChip當別人還在搶GPU的時候,Google已經用AI來設計AI晶片了。今年推出的Ironwood TPU專為推理時代打造,而這背後功臣正是AlphaChip設計方法。軟硬一體的實力,讓Google在能效和算力上擁有了難以複製的優勢。具身智能:AI擁有了身體Google不僅讓AI思考,還讓它「動」了起來。Gemini Robotics 1.5和Genie 3的發佈,標誌著通用世界模型的新前沿。AI智能體正在走出螢幕,進入物理世界和虛擬環境,開始真正地理解和操縱世界。全球影響力:預測未來,拯救生命在應用層面,Google的格局打開了。最新的Weather Next 2模型能以驚人的精度預測天氣,洪水預報覆蓋了全球20億人。從NotebookLM的深度研究功能到Pixel 10的AI體驗,Google正在把「黑科技」變成每個人手中的「水電煤」。還有GoogleEarth AI,最先進的地理空間AI模型。安全與責任:走得快,更要走得穩在狂飆突進的同時,Google依然保持了克制。Gemini 3被稱為Google迄今為止最安全的模型,通過了最全面的紅隊測試。隨著模型能力持續增強,不斷升級工具鏈、資源體系與安全框架,以預見並降低潛在風險。Gemini 3正是這一理念的實踐典範:作為Google迄今最安全的模型,它經歷了公司AI模型中最為全面的安全評估體系。更著眼長遠,探索通往通用人工智慧的負責任路徑,著重提升風險應對能力、完善主動風險評估機制,並與更廣泛的人工智慧社群開展協作。2024年是鋪墊的草蛇灰線,2025年才是一切的爆發。這份涵蓋了從底層晶片、核心模型到頂層應用、科學探索的成績單,我們不得不承認:那個熟悉的、令對手窒息的Google,回來了!看來,2026年,好戲才剛剛開始。Google2025年AI年度回顧一月新年伊始,Google在Gemini、Android、GoogleTV和教育工具上推出了一系列更新。推出了由Gemini驅動的更強大的Android助手:提升手機端的AI體驗,讓助手更懂你的需求。公佈了針對三星GalaxyS25系列及更多裝置的Android系統更新:通過系統底層最佳化,讓新裝置更好地運行AI功能。發佈了面向2025年的全新Google教育工具:推出了一系列新功能,旨在助力教師教學與學生學習。在CES上展示了Google TV的最新功能和改進:利用AI技術提升內容推薦精準度,改善家庭娛樂體驗。在Gemini應用中推出了Gemini 2.0 Flash版本供使用者嘗鮮:以更快的速度和更低的延遲,讓使用者體驗新一代模型的響應能力。二月本月重點展示了AI如何在求職和科學研究等領域帶來實質性改變。宣佈Gemini 2.0模型正式向所有使用者開放:全面放開存取權,讓每個人都能使用Google最新的基礎模型。Gemini Code Assist程式設計助手現在免費提供:降低開發者門檻,利用AI免費輔助編寫和偵錯程式碼。推出了一項新實驗功能,利用AI幫助人們探索更多職業發展的可能性:通過分析使用者技能與興趣,智能推薦潛在的職業路徑。發佈了一款專為科學家設計的新型AI系統:該系統能輔助科學家提出假設、設計實驗並規劃研究路線。iOS使用者現在可以在瀏覽網頁時使用Lens搜尋螢幕上的內容:打破應用壁壘,在蘋果裝置上也能體驗「所見即搜」的便捷。三月搜尋中的AI模式(AI Mode)首次亮相,同時發佈了Gemini 2.5和Gemma 3。發佈了當時Google最智能的AI模型Gemini 2.5:在推理能力和多模態理解上取得了顯著突破。推出了Gemma 3,這是可在單個GPU或TPU上運行的最強模型:為開源社區和端側開發提供了極其強大的性能支援。擴展了AI Overviews功能,並正式引入了「AI模式」:在搜尋中處理更複雜的查詢,提供深度解答而非簡單連結。Gemini應用上線了多項新功能,供使用者免費試用:包括更豐富的檔案分析能力和互動方式。推出了利用Gemini進行協作和創意創作的全新方式:在Workspace等工具中深度整合,提升團隊協作效率。四月硬體與雲端算力的大幅升級,為AI時代奠定基石。發佈首款專為「推理時代」打造的TPU Ironwood:在Google Cloud Next大會上亮相,大幅提升AI推理效率。推出了Google Vids的全新AI視訊生成功能:Workspace使用者可利用AI快速生成工作匯報視訊。發佈AI驅動的網路安全防禦系統:利用大模型即時檢測並防禦複雜的網路攻擊。CloudAssist雲端助手能力升級:幫助企業使用者更智能地管理雲資源和排查故障。發佈了Imagen 3的圖像生成增強版:在生成圖片的細節和文字渲染能力上達到新高度。五月Google I/O開發者大會召開,發佈了AI電影製作工具Flow和Veo 3。回顧Google I/O 2025,展示從研究到現實的跨越:總結了AI技術如何全面落地到Google的產品生態中。推出了由Veo 3驅動的AI電影製作工具Flow:為創作者提供好萊塢等級的AI視訊生成和編輯能力。推出了Google AI Ultra訂閱服務:整合了Google最頂尖的模型和功能,一站式滿足專業使用者需求。在購物中引入AI模式,支援虛擬試衣:利用生成式AI讓使用者在購買前看到衣物穿在自己身上的效果。搜尋中的AI進一步進化,轉向提供智能服務:不僅僅是尋找資訊,而是直接幫使用者完成任務。六月開發工具與移動作業系統的智能化革新。發佈Gemini CLI,打造開源AI智能體工具:讓開發者能在命令列中直接呼叫Gemini建構智能體。正式發佈Android 16作業系統:系統底層深度整合AI,提升流暢度與個性化體驗。推出了SearchLive即時互動功能:支援使用者與搜尋引擎進行即時的語音對話和多模態互動。宣佈擴展Gemini 2.5模型家族:推出了針對不同側重領域(如程式碼、數學)的微調版本。展示了Gemini 2.5在高級音訊對話上的能力:實現了更自然、更具情感的語音互動體驗。七月AI功能深入日常,讓相簿和郵件變得更「聰明」。在Gemini中上線了照片轉視訊功能:利用AI將靜態照片瞬間轉化為生動的視訊片段。宣佈搜尋將迎來更高級的AI能力:增強對長尾問題和模糊需求的理解能力。利用搜尋中的AI模式提供學習新途徑:為學生提供定製化的學習計畫和知識點解析。Gmail推出「管理訂閱」新功能:智能識別並一鍵清理不需要的郵件訂閱,淨化收件箱。為Pixel使用者推送了驚喜功能更新(PixelDrop):通過軟體更新為舊款Pixel手機帶來了最新的AI特性。八月硬體盛宴,Pixel 10系列攜手全新AI體驗登場。正式發佈Pixel 10系列手機:搭載最新TPU晶片,是首款為「全天候AI」設計的終端裝置。Gemini圖像編輯功能迎來重大升級:引入更精準的局部重繪和風格遷移能力。宣佈向大學生免費提供GoogleAI工具:投入資金與資源,普及AI教育,賦能下一代創新者。在Gemini應用中上線DeepThink功能:讓模型在回答覆雜問題前進行更深度的邏輯推理。推出了全新的AI驅動航班搜尋工具FlightDeals:智能預測票價趨勢,幫使用者鎖定最佳出行時機。九月Chrome瀏覽器重構,AI開始接管瀏覽器體驗。揭秘Chrome瀏覽器全新AI功能背後的技術:解釋了端側小模型如何讓瀏覽器更快、更安全。利用AI重新構想Chrome瀏覽器:推出智能標籤頁管理、網頁摘要和寫作輔助等功能。介紹了通過SearchLive獲取即時幫助的方式:展示了在旅行、維修等場景下視訊通話式搜尋的威力。Android更新帶來更智能的寫作與分享:輸入法不僅能糾錯,還能根據語境自動補全長句。最新PixelDrop包含Material 3 Expressive升級:UI設計語言進化,帶來更靈動、更具表現力的互動動畫。十月具身智能與醫療AI取得突破,Gemini學會操作電腦。推出了Gemini 2.5 ComputerUse模型:模型現在可以像人一樣查看螢幕、移動游標、點選按鈕,執行複雜操作。發佈Veo 3.1模型並提升Flow功能:視訊生成的連貫性和時長進一步提升,支援更細粒度的控制。發佈專為Gemini建構的GoogleHome裝置:智能音箱和攝影機具備了更強的本地AI處理能力。分享Gemma模型幫助發現癌症治療新路徑:展示了開放模型在生物醫學領域的巨大科研價值。宣佈Nano Banana 模型應用更廣:這款輕量級圖像模型被整合到搜尋、NotebookLM和相簿中,提供極速體驗。十一月年度重磅,Gemini 3橫空出世,開啟智能新紀元。宣佈Gemini 3的誕生:Google迄今為止最強大的AI模型,具備前所未有的多模態推理能力。推出了更專業的Nano Banana Pro模型:在保持速度的同時,大幅提升了圖像生成的藝術質量和逼真度。面向開發者開放Gemini 3:API同步上線,邀請全球開發者共同建構基於新模型的下一代應用。Gemini 3為Gemini應用帶來新功能:普通使用者也能立即體驗到新模型帶來的更聰明、更人性化的對話。Google地圖導航功能通過Gemini獲強力升級:提供更直觀的實景導航和基於語境的地點推薦。十二月(December)以速度極快的Gemini 3 Flash和年度熱搜收官。推出了專為速度打造的Gemini 3 Flash:在保持高智商的同時,將響應延遲降至極低,適合即時應用。Gemini 3 Flash開始在全球搜尋中推出:讓每一次搜尋都能獲得瞬間生成的AI智能摘要。發佈了2025年度熱搜報告:回顧全年搜尋趨勢,展現AI如何重塑人們獲取資訊的方式。Android 16新更新幫助使用者組織資訊:利用端側AI自動整理手機中的通知、檔案和照片。將最先進的Gemini翻譯能力引入Google翻譯:實現了同聲傳譯等級的即時翻譯效果,打破語言障礙。 (新智元)
GoogleAI逆襲背後的頭號功臣
【新智元導讀】Google AI 在 2025 年下半年打了個漂亮的翻身仗,用 Nano Banana 和 Gemini 3 Pro 這兩款殺手級模型,從 OpenAI 手下搶走了大量使用者。背後的功臣,對內聲名顯赫,對外默默無聞。他是誰?他有著怎樣傳奇的故事?在Google最危險的時刻,一位不為外界熟知的中年人在內部臨危受命。他引領團隊開發出爆紅的AI應用,讓GoogleAI業務起死回生,甚至一度打敗 ChatGPT 登頂應用榜。他是誰?他的故事揭示了Google如何用創新和責任心,在 AI 競賽中重奪主動權。GoogleAI逆襲背後的「無名」功臣2025 年 8 月的一個深夜,Google資料中心的警報突然頻繁響起——伺服器負載飆升至前所未有的水平。工程師們開玩笑說,再這麼下去,他們特製的TPU晶片恐怕都要被燒化了。引發這一切的,是Google Gemini 應用中新上線的圖像生成功能「Nano Banana」。這個功能可以將多張照片融合成獨特的數字人偶,意外地在全球引爆了使用者熱情。短短幾天裡,海量使用者湧入嘗鮮,生成的圖片數量迅速突破數十億張,直接把Google的伺服器「烤」得冒煙。Google被迫緊急對 Nano Banana 的使用加以限制,以免後台基礎設施真的撐不住這股熱潮。然而,這場近乎「失控」的走紅非但沒有讓Google高層惱火,反而令整個公司為之振奮——Gemini應用終於一戰成名。在8月底功能推出後的短短一個月內,Gemini 累計生成圖像超過 50 億張,甚至一度超越 OpenAI 的 ChatGPT 躍居蘋果 App Store 下載榜首。而站在這一切背後的操盤手,正是一位在公司內部聲名顯赫,對外低調神秘的中年人:Josh Woodward。42 歲的 Josh Woodward 並非矽谷家喻戶曉的名字,但在Google內部,他幾乎是傳奇般的存在。這位出生於美國中部奧克拉荷馬州的產品經理,2009 年通過實習進入Google,從此一路在各種創新項目中嶄露頭角。早年間他曾參與建立Google最初幾代 Chromebook 筆記型電腦,聯合創立了面向新興市場使用者的「下一個十億使用者(NBU)」計畫,並主導了 Google Pay 支付服務的拓展。豐富的履歷和雷厲風行的作風,使他在內部備受推崇。正因如此,當Google在生成式AI領域感到空前的壓力時,管理層想到了 Woodward。2025 年 4 月,Google AI 戰線進行了一次關鍵人事調整:一直埋頭於實驗室業務的 Woodward 被提拔為 Gemini 應用負責人,接過公司AI戰略的帥印。當時,OpenAI 憑藉 ChatGPT 在 AI 領域風頭正勁,行業專家紛紛預言使用者將從傳統搜尋轉向AI應用。Google痛感自己的搜尋霸主地位受到威脅,加上母公司 Alphabet 一季度股價暴跌約兩成,亟需一場勝利來重振士氣。接任後的 Woodward 深知責任重大,他一手主管 Gemini 應用業務,同時仍領導著Google旗下的新興技術試驗田——Google Labs,肩負起在 AI 競賽中為Google開闢新賽道的雙重任務。「TPU 快被燒化了!」 AI爆款的誕生Woodward 上任後不久,就迎來了大顯身手的機會。這款名為 Gemini 的 AI 應用原本籍籍無名,卻因為一個名叫「Nano Banana」的新功能而聲名鵲起。Nano Banana 最初只是團隊的一次創意迭代:使用者可以上傳多張自己的照片,由AI將其合成為一個獨一無二的數字玩偶形象。沒想到這個充滿趣味的功能一推出就風靡全球,伺服器上一時間請求暴增。據Google AI 基礎架構負責人 Amin Vahdat 回憶:「我們的TPU晶片組當時幾乎要被烤化了!」。團隊不得不暫時為 Nano Banana 設定使用上限來緩解壓力。然而,這次「小危機」凸顯的正是巨大的機會:使用者對個性化AI創作的渴求超出了所有人的想像。Woodward 敏銳地意識到這正是 Gemini 突圍的契機。在他的推動下,團隊連夜擴容後台算力,全力保障這一功能的穩定運行。事實證明,這場硬體「險情」恰是 Gemini 騰飛的起點——到 9 月底,Gemini 應用累計生成的圖像已突破 50 億張。憑藉 Nano Banana 的爆紅,Gemini 應用的月活躍使用者從 3 月的 3.5 億飆升到 10 月的 6.5 億。更令Google揚眉吐氣的是,在 Nano Banana 帶動下,Gemini 在蘋果 App Store 的下載量一舉超越了 ChatGPT,登上免費應用榜冠軍。Google用了不到半年時間,就實現了從 AI 跟隨者到市場領跑者的驚人逆轉。Alphabet 公司的股票也隨之止跌回升,到年底累計上漲了 62%,成為當年美股中表現最亮眼的科技巨頭之一。這一切都令業界震動:Google似乎找回了久違的速度與激情,而推動公司完成這次AI領域「逆襲」的關鍵人物,正是 Woodward。對於 Gemini 的成功,Woodward 保持著難得的清醒與冷靜。他深知,在快速推進 AI 創新的同時,更需要慎重考慮技術可能帶來的負面影響。今年 11 月,Google發佈最新的大模型 Gemini 3,引發行業轟動。在接受媒體採訪時,Woodward 興奮地表示「我從來沒有像現在這樣覺得工作充滿樂趣」 ——AI 模型的強大能力讓各種天馬行空的產品創想成為可能。但身為掌舵者,他也時刻警惕著技術的雙刃劍。此前,他就在紅杉資本的播客節目中坦言,AI 的進步正處於一個足以「改變時代」的關鍵節點,這種改變「可能是向善的,也可能是適得其反的」。事實證明,Nano Banana 功能在爆紅的同時也一度引發爭議:有使用者使用它根據提示詞合成援非人道主義場景的形象時,生成的畫面卻是身著便服的白人女性周圍圍繞著非洲黑人兒童,引來種族刻板印象的批評。這類爭議讓 Woodward 更加意識到,AI 產品在追求創新的同時絕不能忽視社會責任。他要求團隊迅速最佳化演算法,避免再次出現類似偏見輸出,並強調任何 AI 新功能上線前都要經過更嚴格的審查。Google內部也在他的倡議下設立專門機制,評估熱門AI應用可能引發的道德和信任問題,力求在保持高速創新的同時守住「不會傷害使用者信任」的底線。Google在制定AI產品戰略時相當克制理性。Woodward和他的上級、DeepMind CEO 哈薩比斯(Demis Hassabis)商議後,有意避開了時下火熱但容易引發倫理爭議的「AI情感伴侶」方向,而是堅持將Gemini定位為提升工作效率的超級工具。Google內部給Gemini制定的考核指標並非使用者粘性或時長,而是每天幫助使用者完成了多少實際任務。這樣的取捨背後,是Woodward對於AI角色邊界的深思——AI最重要的價值應在於賦能人類,而非讓人沉迷於虛擬陪伴。當下,生成式AI正加速滲透進人們生活的方方面面,海量AI生成內容充斥網路,真偽難辨。Woodward比任何人都清楚,Google必須加倍謹慎,既要跑贏競賽,又不能因魯莽而丟掉使用者多年來對Google品牌的信任。因此,他在業務衝鋒的同時,以身作則地為團隊敲響警鐘:「我們正處在一個技術巨變的關口,這種變革將影響好幾代人。身處這個位置,我們必須確保它被用來促進善意,而非滋生危害。」敢想敢幹 「讓他們盡情去做」Gemini應用的成功並非偶然。事實上,Woodward上任之前就在Google內部孵化出多款頗具前景的AI產品。其中最出名的,當屬AI筆記助理NotebookLM。它最初只是Google Labs團隊一個默默無聞的試驗項目——資深產品經理Raiza Martin利用工作之餘的「20%時間」開發了一個名為Project Tailwind的原型:它可以讓使用者上傳文件、PDF甚至視訊,然後由AI提煉要點、生成摘要或見解。Woodward對這個創意一眼相中,大力支援團隊繼續打磨。為了把這個項目做成真正貼近使用者需求的產品,他大膽採取了一系列「非常規」舉措,打破了Google內部的慣例和層層壁壘。首先,Woodward從外部網羅來一位出人意料的「臨時盟友」——科技作家史蒂文·約翰遜(Steven Johnson)。Johnson在業界小有名氣,出版過多本暢銷書,卻從未在任何公司任職過。2022年,Woodward讀到Johnson關於AI與創意的文章後深受啟發,竟主動發出邀請,請他以訪問學者的身份加入Google Labs,共同探索如何用AI增強人類的創造力。對於這種「不按常理出牌」的合作模式,Woodward的想法很簡單:「讓四五個工程師和一個真正的作家碰在一起,看看會產生什麼火花」。在他的牽線下,Johnson開始兼職參與Project Tailwind,為團隊提供作家視角的輸入,分享職業寫作者整理資訊的工作流。工程師們在一旁觀察他的使用習慣,不斷改進產品功能。一段時間磨合後,Johnson深深投入其中,最後乾脆接受了Woodward的邀請轉為全職,擔任NotebookLM團隊的「創作總監」。這樣「破圈」的人才能夠加盟Google,靠的正是Woodward勇於創新用人的魄力。不僅如此,為了快速完善NotebookLM,Woodward還鼓勵團隊主動擁抱外部使用者社區的力量。在產品開發早期,團隊希望收集真實使用者的反饋來改進產品。按常規,Google內部有自己的論壇和郵件列表,可以用來做封閉測試。但年輕的產品經理Raiza更傾向於直接去主流社群與使用者互動,她選擇了當下開發者和AI愛好者云集的平台——Discord聊天伺服器。這在當時引起了一些內部爭議:畢竟Google一向偏好使用自家產品,很多高管甚至不知道Discord為何物。有管理人員質疑:「為什麼不用Google Meet會議或者內部群組?」對此,Woodward全力支援Raiza的提議。他乾脆對團隊撂下一句:「讓他們盡情去做吧(Let them cook)!」在他的力挺下,NotebookLM項目組順利搭建了Discord伺服器,與第一批種子使用者直接交流。這種開放姿態很快收穫了回報:借助社群力量,NotebookLM在打磨階段就吸引了大批AI發燒友的關注,產品不斷根據反饋迭代升級。到2024年底,該Discord社區已匯聚了超過20萬名成員,成為Google史上最活躍的產品使用者社區之一。很多團隊成員坦言,如果沒有Woodward頂住內部壓力允許他們「破例」用第三方平台,這款產品不可能進步得如此快、如此好。終於,2023年5月,Woodward帶著打磨成型的NotebookLM走上Google一年一度的I/O開發者大會舞台。在Google雲CEO托馬斯·庫裡安的主題演講結束後,Woodward出人意料地現身台上。他先是賣了個關子,向台下觀眾介紹說:「我們在幾周內用五名工程師拼出了一個新點子,叫作Project Tailwind。我自己的母校俄克拉荷馬大學師生也參與了內測。大家想看看它能做什麼嗎?」隨後,他現場操作筆記應用,匯入幾篇文件。不出幾秒,螢幕側欄便自動生成了這些材料的關鍵詞和延伸提問。他隨手點開「引用來源」按鈕,興奮地介紹道:「這個功能是我最喜歡的——AI會標註出每條答案背後的出處。 」短短幾分鐘的演示贏得滿堂喝彩。NotebookLM就此進入公眾視野,並在隨後數月向廣大使用者開放試用,上線不久便廣獲好評。Google很快為其加入了支援音訊、視訊內容的分析功能,讓這款AI筆記助手更趨完善。NotebookLM的成功不僅證明了Woodward識人用人的獨到,也驗證了他推動內部「減小阻力」所取得的成效。在官僚體系龐大的Google公司,許多創新想法往往困於流程冗長、部門掣肘。為此,Woodward在Google Labs內部設立了一個特別機制,員工如果遇到體制上的「絆腳石」可以提交一個代號為「Block」的工單,由專門團隊迅速協調資源排障。NotebookLM項目在籌備上線時一度面臨算力不足的問題,Woodward 便通過這一機制火速調撥了更多TPU算力支援,確保產品性能萬無一失。據團隊工程師回憶,有了「Block」系統的保駕護航,他們再也不用為內部審批耗費精力,可以心無旁騖地專注於產品研發。「有這樣一位負責人幫我們清理那些惱人的障礙,我們才能真正將精力放在使用者身上。」Google Labs 的一名軟體工程師 Usama 感嘆道。小細節,大作為Woodward 領導風格中另一個令人稱道的特點,是他對「細節決定成敗」的高度重視。擔任 Gemini 和 Google Labs 負責人後,他發起了一項名為「Papercuts」(紙割傷)的內部計畫,專門蒐集和快速修復那些雖然不至於致命、但影響使用者體驗的「小傷口」。在 Woodward 看來,這些細枝末節的改進往往最能打動使用者,卻常被大公司忽視。有使用者抱怨在 Gemini 聊天時無法中途切換大模型而不重新開始對話,Woodward 知道後立刻催促工程師最佳化。不久他就在自己的 X 帳號上驕傲地宣佈:「Papercut 已修復:現在你可以在 Gemini 應用的對話中途切換模型而無需重新啟動會話了。」這條動態下面,許多使用者紛紛留言點贊,感謝他傾聽並解決了困擾自己的「小問題」。事實上,親自聆聽使用者聲音、持續打磨產品細節,幾乎已經成為 Woodward 工作的日常。身為公司高管,他卻常常一頭紮進社交媒體的一線陣地,在 X 和 Reddit 上直接回答使用者提問、收集吐槽反饋。業界人士形容這在科技巨頭中相當少見——一位負責核心產品的副總裁竟然親自在論壇上當「客服」,甚至把使用者直言不諱的批評意見轉發給開發團隊要求改進。但在 Woodward 看來,這正是產品經理應有的擔當:「使用者願意花時間告訴我們問題出在那兒,那就是在幫我們變得更好。」NotebookLM 團隊一名前設計師 Jason 回憶,Woodward 經常帶著從使用者社區蒐集的反饋走進會議室,對大家說「看看,這是使用者真正關心的,我們能做點什麼?」Jason 由衷佩服地說:「這種對終端使用者的承諾和執著,我在其他領導身上幾乎沒見過。」Woodward 平易近人的人格魅力也在這些「小事」中展露無遺。同事們常提起他的一個招牌舉動:當有團隊成員因為線上評論的批評而情緒低落時,Woodward 會故作誇張地哈哈一笑,用他那帶著中西部口音的爽朗笑聲打趣道:「走,一起回覆網友去!」據說,沒有人能抗拒他這富有感染力的笑聲——緊張的氣氛瞬間就被他化解了。前同事 Caesar Sengupta 曾打趣地評價:「我從沒見他對誰發過火。」這位與 Woodward 共事多年的Google前高管甚至半開玩笑地放言:「照這樣下去,他早晚會成為Google的 CEO。」雖然只是戲言,但也從側面反映出 Woodward 在Google內部的威望和人望之高。從奧克拉荷馬小鎮少年 到Google中流砥柱在成為Google AI 戰略幕後英雄之前,Josh Woodward 的人生軌跡並非典型的「矽谷精英」路線。他 1983 年出生於美國奧克拉荷馬州一個普通家庭,自幼成長於埃德蒙德(Edmond)小鎮。從小勤奮好學的 Woodward 考入了家鄉的俄克拉荷馬大學主修經濟學,2006 年以優異成績畢業,並被評為年度傑出畢業生之一。大學期間,他對公共事務和全球視野表現出濃厚興趣,積極參加各類學生領導力項目。畢業後,他獲得獎學金遠赴英國牛津大學深造,攻讀比較政府學,並於 2009 年拿下碩士學位。在牛津,他把研究重點放在美國軍事及經濟援助對外國民主處理程序的影響上——這一少有人問津的題目透露出他對「科技與社會」「力量與責任」等宏大命題的早期思考。也許正因如此,當他回到美國踏入科技行業時,能始終從更長遠的角度審視手中的技術。2009 年,Woodward 以產品管理實習生的身份加入Google,很快顯露出過人的敏銳和領導才能。他樂於接受具有挑戰性的任務,勇於從零開始打造新項目。在Google工作最初十年裡,他涉足多個前沿領域,從硬體裝置到新興市場,無不留下自己的印記:他參與了 Chrome 作業系統和首批 Chromebook 筆記本的開發;自告奮勇加入公司新成立的「NBU」計畫,去研究和服務印度等地第一次觸網的海量使用者,並因此被視為NBU項目的奠基人之一;後來又接手 Google Pay 的國際化拓展業務,為數億使用者帶去便捷的移動支付體驗。這些橫跨軟硬體、全球市場的經歷,讓 Woodward 對「如何讓技術普惠大眾」有了深刻理解。這種理念也貫穿在他之後負責的AI產品中——無論是 NotebookLM 還是 Gemini,他始終強調的是為使用者創造真正有用的價值,而不僅是炫技式的噱頭。Woodward 還有一個鮮明的個人標籤:酷愛閱讀且樂於分享。熟悉他的人都知道,他的辦公室和家中總是堆滿書籍,從商業傳記到科幻小說無所不讀。據說Google高管層每每想找本好書讀時,第一個諮詢的對象就是 Woodward。他至今堅持寫閱讀筆記,早年在 NBU 團隊時便每周編輯一封內部通訊,內容簡潔而發人深省,當時這封通訊在Google內部意外走紅,許多人聞訊後紛紛來信請求訂閱。如今儘管工作繁忙,他仍保持著每季度給團隊和朋友們寫一封「Josh 通訊」的習慣,分享自己近期讀到的有趣見解。身邊同事戲稱他是Google的「行走書單」。更難能可貴的是,Woodward 不僅博覽群書,還善於將知識活用於工作決策中。據前文提到的 Raiza 回憶,在 NotebookLM 項目開發過程中,Woodward 曾特地發給她一篇論文,探討使用者究竟能否信任AI聊天機器人的答案。這讓 Raiza 意識到,領導關心的不僅是產品功能實現,更是產品能否真正贏得使用者信任。類似的故事不勝列舉——他會建議團隊工程師閱讀科幻小說,從中獲得對未來技術的想像力;也會邀請人文學者來交流,提醒大家科技創新不能脫離人文關懷。這些細節都體現出 Woodward 作為領導者的深度與溫度。變革時代的掌舵者2025 年行將結束之際,Google憑藉在AI領域的一連串突破重新煥發了生機:從 Gemini 3 模型的橫空出世,到一個又一個「現象級」應用的推出,整個公司一掃年初的低迷,士氣高漲。CEO 桑達爾·皮查伊(Sundar Pichai)在全員大會上興奮地表示:「過去這一年的進展真是令人難以置信——Google各個團隊都在以前所未有的速度推出新功能。」而站在這股 AI 浪潮中央、備受矚目的,正是 Josh Woodward 和他所率領的團隊。展望 2026 年,業界對Google寄予厚望,期待這家科技巨頭繼續以 Responsible AI(負責任的人工智慧)的姿態領跑。在聚光燈之外,Woodward 依然埋頭忙碌著:既要帶領兩個部門創新競速,又要謹慎把關每一項技術的潛在影響。然而,這位久經考驗的「Google AI 掌櫃」臉上沒有焦慮,有的只是對未來的堅定信心和一絲藏不住的興奮。在最近的一次採訪中,當被問及如此高壓的工作如何堅持時,他爽朗一笑:「因為從未像現在這樣好玩啊!」對於熱愛挑戰的他來說,這或許正是真正的樂趣所在——身處巨變浪潮之巔,以初心為舵,划槳向前,讓技術的光芒照亮而非灼傷這個世界。 (新智元)
Scaling Law沒死! Gemini核心大佬爆料,Google已有顛覆性金鑰
Google大模型將迎顛覆升級! Gemini負責人爆料:長上下文效率與長度雙重突破在即,注意力機制迎來驚人發現。 Scaling Law未死,正加速演變!Google又要有重大突破了?最近,Google DeepMind的Gemini預訓練負責人Sebastian Borgeaud在採訪中給出重磅爆料——未來一年,大模型預訓練領域將在「長上下文處理效率」和「上下文長度擴展」兩大方向迎來重大技術創新。同時,Google Gemini三巨頭——Jeff Dean、OriolVinyalsML和Noam Shazeer罕見同台了,他們的對話中,跟Sebastian的內容展現出了驚人的一致。眾多高瞻遠矚、閃爍著智慧光芒的思想讓人深思。難怪,Google依然是那個巨人。Google大佬激動預言已破解大模型核心秘密Google DeepMind的Gemini預訓練負責人Sebastian Borgeaud在最近的訪談中表示,預計在未來一年內,針對提升長上下文處理效率以及進一步擴展模型上下文長度的預訓練技術,將會有重大創新。另外他還透露說,最近他們在注意力機制方面取得了一些非常有趣的發現,這可能會在未來幾個月內重塑他們的研究方向。對此,他表示非常興奮。而他提出了振聾發聵的一句話:Scaling Law並未消亡,只是正在演變!Sebastian Borgeaud是Gemini 3的預訓練負責人。這一次,是他首次接受部落格採訪,帶我們深入理解了Gemini 3背後的實驗室思維——變化究竟發生在那裡,為什麼現在的工作不再是“訓練模型”,而是建構一個完整的系統。Gemini 3背後:AI的未來正在加速到來一場意外的飛躍後,一個系統誕生了。「如果對自己誠實的話,我想……我們比我認為我們能達到的地方,走得更遠了。」坐在麥克風前的Sebastian Bourjou語氣平靜,但這句話卻像一顆投入湖面的石子,激起無限漣漪。為何Gemini 3會實現如此巨大的效能飛躍?Sebastian的回答看似很簡單:「更好的預訓練和更好的後期訓練」。然而,在這輕描淡寫的背後,卻是一個根本性的認知轉變。「我們不再只是在建立一個模型了,」他緩緩說道,「我認為,在這一點上,我們真正在建構的是一個系統。」而這,就是Gemini 3顛覆性進步的關鍵。人們常常想像,從一個Gemini版本到下一個版本,總有一些石破天驚的「秘密武器」。但Sebastian揭示的真相是:進步源於無數細微改進的聚合。是來自龐大團隊中,日復一日發現的那些「旋鈕」和最佳化。他還指出,AI發展範式正在經歷的潛在轉移:過去,我們彷彿擁有無限資料,可以隨意擴巨量資料集;而現在,我們正轉向一個「資料有限」體制。這意味著,未來的AI,必須學會更有效率地利用有限的資料資源,建構更複雜的系統工程。這也就是模型架構研究的核心價值。這一轉變,將迫使整個產業從「大力出奇蹟」的粗放模式,轉向「精雕細琢」的精細模式。未來的競爭焦點,將不再是「誰的資料中心更大」,而是「誰的學習演算法更有效率」、「誰的模型架構更優雅」、「誰能從有限資料中提取更多智慧」。而Gemini 3的大腦架構-混合專家模型MoE,代表了LLM發展的一條清晰路徑:從追求單純的「大」,轉向追求「大而高效,大而智慧」。AI的下一站——長上下文、高效檢索與「成本革命」展望未來幾年的技術前沿,Sebastian指出了激動人心的方向,它們將共同塑造下一代AI的能力和形態。1. 長上下文:從「短記憶」到「海量工作台」Gemini 1.5帶來的超長脈絡能力,已經是一場變革。 Sebastian預測,這方面的創新將持續加速。 「我認為未來一年左右,將在使長上下文更有效率、並進一步擴展上下文長度方面看到更多創新。」這不僅僅是“記住更多”這麼簡單。超長上下文將把模型變成一個真正的數字工作台:它可以同時載入整個程式碼庫、多篇科學研究論文、長時間對話歷史,並在其中進行連貫的分析、推理和創作。這為複雜的多步驟任務、深度研究和創作提供了前所未有的可能,是邁向更強大「智能體」的關鍵基礎設施。2. 注意力機制的進化Sebastian特別提到,在注意力機制上,「我們最近有了一些真正有趣的發現,我認為這將塑造未來幾個月的大量研究。」他對此「個人非常興奮」。這暗示著,被認為是當前大模型基石的注意力機制,仍有巨大的改進空間。更有效率、更強大或具備新特性的注意力機制,可能從底層顯著提升模型的理解、推理和計算效率,是推動性能邊界的重要槓桿。3. 檢索的回歸:讓模型學會「查資料」Sebastian早期曾主導「Retro」項目,研究讓模型在訓練和推理時檢索外部知識庫,而不是將所有知識死記硬背在參數中。他認為,這一方向遠未過時。「我內心深處相信,長期的答案是以可微分的方式學習這種能力。」這意味著,未來模型可能將檢索與推理更原生地結合,動態地從海量知識源中獲取資訊進行思考,而不是依賴後期「嫁接」的搜尋工具。這能讓模型更準確、更及時,並可能突破參數規模的知識容量限制。4. 效率與成本的「革命」一個日益凸顯的挑戰是:隨著使用者激增,模型的部署和服務成本變得至關重要。未來的研究將不再只追求性能峰值,還必須關注如何讓強大模型變得「便宜又好用」。我仍看不到盡頭採訪臨近尾聲,當我們把鏡頭拉回這位站在AI浪潮之巔的研究者本人時,Sebastian的回答透露著一種沈靜的樂觀與純粹的熱情。儘管探討了資料瓶頸、成本挑戰等現實問題,但Sebastian對AI進步的整體判斷依然充滿信心。「我已經多次提到這一點,但確實有如此多不同的事情會復合起來,還有許多有改進空間的方向。我現在真的看不到這類工作停止給我們帶來進步的任何盡頭。」這種信心並非盲目。它源於他作為一線領航者所目睹的:大量細微但確定的改進空間,以及整個領域尚未枯竭的創造活力。在他看來,至少在未來幾年,這種進步勢頭不會放緩。規模不再是神話 Noam Shazeer回歸後的第一桶冷水接下來,是Jeff Dean、Noam Shazeer、Oriol Vinyals三位大佬的對話。在會議中,我們能明顯感受到,Noam不再是那個把油門踩到底的激進派。他幾乎不主動談論「顛覆」,也很少用那些讓人血脈噴張的宏大詞彙。甚至一反常態,多次談到研發節奏、系統的穩定性,以及如何長期運作。作為Transformer的開創者,他曾經引領著大模型從無到有;現在,大模型一路高歌猛進,他卻停下來警告:大模型給出的答案太快,自我檢查的次數太少。他曾在公開場合反覆強調:現在的模型並不缺乏「聰明」,缺乏的是持續思考,並在複雜任務中反覆修正的能力。也就是說,大模型的規模依然重要,但它不再是決定一切的唯一變數。當Noam討論推理時,他明顯將重心從「能不能更強」移向了「能不能更穩定」。這是他回歸Google後,第一次在公開場合展現這種判斷。聽起來不像是否定過去,而更像是在承認一個事實:那條單純靠堆參數就能不斷前進的路,已經接近邊界了。頂級科學家的共識:一次高分,無法定義AI的未來Noam提到一個字:慢思考(Slow Thinking)。不只是簡單的放慢研發速度,而是反覆追問值不值、貴不貴、能不能被規模化複製。至此,智慧不再是一項抽象的能力,而是一項需要長期支付的工程開銷,需要和CPU、硬碟一起放進帳本裡討論。這一步一旦邁出去,許多過去衡量AI的標準,如Benchmark也慢慢失效。在整場會議中,三位頂級科學家沒有表現出對榜單的興奮,也沒有用「誰贏了誰」來定義進展。榜單擅長衡量瞬時表現,卻很難回答「能不能一直運行」這類長期問題。而Noam和Jeff反覆強調的,恰恰是後者:模型是否可靠、是否具備遷移能力、是否能在複雜任務中持續自我修正。這些能力,很難被壓縮成漂亮的數字。Gemini被當成System,而不是Model在這場對話裡,「System」出現的頻率極高,這顯然不是一種修辭。Noam和Jeff在描述Gemini時,刻意避開了「一個更強的模型」這種表述,而是反覆強調它是一個可以長期運行、不斷迭代的「系統」。「系統」和「模型」,聽起來差不多,但背後的邏輯天差地別。「模型」更像是一次性的成果,是在​​實驗室裡的瞬間表現;而「系統」更像基礎設施,它關心的是穩定性、可擴展性,以及在出現錯誤後能不能快速修復並繼續工作。對於Noam這類,極度強調架構設計、研發節奏和工程約束的人,天然會更在意一個系統能不能穩健地運行十年、二十年,而不是某一次響應速度有多快。在他們眼中,Gemini不是勝利者的獎品,而是一種「長期可用」的智慧形態。正因如此,整場對話沒有急於求成的產品宣發,沒有劍拔弩張的「對標某模型」。它更像是在對外強調:Google追求的不是曇花一現的成品,而是一套能重複使用、不斷進化的智慧工業體系。 (新智元)